# DATA_DICTIONARY (as of 2025-11-05 15:20 UTC)

本数据字典基于当前 `lossless_merged.csv` 自动生成，提供列清单与建议口径标签。

## 列清单
- **triple_id**：（未归类）
- **subject_id**：（未归类）
- **predicate**：（未归类）
- **object_id**：（未归类）
- **object_is_literal**：（未归类）
- **sub_entity_label**：（未归类）
- **sub_entity_type**：（未归类）
- **obj_entity_label**：（未归类）
- **obj_entity_type**：（未归类）
- **object_literal**：（未归类）
- **qualifier_or_note**：限定
- **evidence_id**：（未归类）
- **source_doc**：（未归类）
- **page_start**：（未归类）
- **page_end**：（未归类）
- **locator**：（未归类）
- **quote**：证据锚点
- **extraction_method**：（未归类）
- **confidence**：（未归类）

## 指标口径
- EAR：至少具备 `evidence_page / evidence_url / source / quote` 之一计为对齐。
- SPR（代理）：需同时满足三元组主干完整 + 至少一项证据字段存在。

---
## 字段模板（示例填充）
| 字段名 | 类型 | 角色 | 取值域/单位 | 质量规则 | 示例 |
|---|---|---|---|---|---|
| triple_id | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| subject_id | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| predicate | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| object_id | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| object_is_literal | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| sub_entity_label | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| sub_entity_type | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |
| obj_entity_label | string | （主干/限定/证据） | — | 非空校验（如适用）；字符长度≤1024 | 示例值 |

## RDF 映射说明
- 命名空间：`ex:` 用于节点/语句，`rel:` 用于关系谓词，`prov:` 用于元数据。
- RDF 导出文件：`lossless_merged.ttl`；每行映射为 `ex:stmt/{i}`，列名映射为 `ex:<列名>` 属性；若检测到三元组主干列则同时输出 `<subject> <predicate> <object>` 核心三元组。


## Controlled Vocabularies (Suggested)
- **predicate** allowed values (top observed): `includes`, `concerned_about`, `views`, `partners_with_group`, `formal_dialogue_with`, `recommended_approach`, `receptive_to`, `policy_shift`, `favors_cooperation_with`, `signs_agreement_with`, `security_anchor`, `economic_dependency`, `dispute_with`, `foreign_policy`, `engagement_prospect_with`, `seeks`, `prefers_cooperation_on`, `policy_stance`, `seeks_dialogue_with`, `focuses_on`
- **confidence** must be float in [0,1].
- **timestamp** recommended ISO-8601.
- **qualifier_or_note**: time/place/role/process labels.
